بررسی و مقایسه روش های انطباق و بهبود پرس وجو برای موتورهای جستجو در محیط وب

thesis
abstract

پرس وجوهای مبهم و کوتاه ارسالی به موتور جستجوها، به بازیابی نتایج غیرمرتبط منجر می شود. روش های انطباق پرس وجو سعی می کنند تا پرس وجوها را ابهام زدایی کنند و پرس وجو را با نیازهای اطلاعاتی کاربر منطبق کنند. بسط پرس وجو یکی از روش های انطباق پرس وجو است که سعی دارد کلمات مرتبطی را به پرس¬وجو اضافه کند، که می توان کلمات بسط را به صورت محلی و سراسری انتخاب کرد. بسط پرس وجو معمولا کارایی سامانه های بازیابی اطلاعات را افزایش می¬دهد. بازخورد مرتبط (rf) و بازخورد شبه مرتبط (prf) روش های بسط پرس وجو هستند که به ترتیب از اطلاعات بازخورد کاربر و اسناد رتبه بالا در نتایج اولیه استفاده می کنند تا کلماتی مرتبط را به پرس وجو اضافه کنند. راه کارهای محلی برای بسط پرس وجو، از اسناد رتبه بالای نتایج اولیه در روش بازخورد شبه مرتبط استفاده می کنند، که به بهبود کارایی سامانه ی جستجو کمک می کند. راه کار خوشه بندی لی و کرافت سعی می کند تا از هم پوشانی خوشه های ساخته شده با الگوریتم knn، برای انتخاب اسناد مرتبط استفاده کند. راه کار پیشنهادی ما، از الگوریتم knn برای خوشه بندی اسناد نتایج اولیه استفاده می کند. برای رسیدن به خوشه های بهتر، از شباهت حساس به پرس وجو استفاده کرده¬ایم. اعضای خوشه ها رتبه بندی شده و خوشه ها نسبت به هم رتبه بندی می شوند تا بتوانیم اسناد بهتر را از خوشه های رتبه بالا انتخاب کنیم. اسناد مرتبط انتخاب شده با هم ترکیب می شوند و کلمات بسط از سند ترکیبی با تابع رتبه¬بندی tf-idf انتخاب می شوند. کلمات انتخاب شده به پرس وجو اضافه می شوند تا بازیابی با پرس وجو بسط-داده شده انجام گیرد. برای ارزیابی راه کار ارائه شده از مجموعه داده ی پزشکی med استفاده کرده ایم. نتایج آزمایشات نشان می دهد که راه کار پیشنهادی، کارایی را نسبت به بازیابی پایه vsm و بازخورد شبه مرتبط بهبود می دهد. کارایی با خوشه های ساخته شده با شباهت حساس به پرس وجو نسبت به شباهت مبتنی بر کلمه افزایش پیدا کرده است که نشان از موثر بودن شباهت حساس به پرس وجو در خوشه بندی اسناد نتایج اولیه دارد

similar resources

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

full text

موتورهای جستجو در اینترنت

شاید تاکنون در مورد اینترنت و موتورهای جستجوگر مطالب زیادی شنیده و خوانده باشید. ما در اینجا سعی در معرفی مجدد تعدادی از آنها بصورتی بسیار فشرده و مختصر داریم تا در زمان کمتر بتوانید به اطلاعات مورد نیاز خود برسید. همچنین سعی می کنیم به معرفی تعدادی از سایتهای اطلاعاتی با کاربری بالا بپردازیم.

full text

بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو

بسط پرس‌وجو به‌عنوان یکی از روش‌های انطباق پرس‌وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می‌دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس‌وجو است که فرض می‌کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس‌وجو هستند و کلمات بسط را از این اسناد انتخاب می‌کند. درحالی‌که ممکن است اسناد نامرتبط به پرس‌وجو در اسناد رتبه‌بالا وجود داشته باشد. روش‌هایی برای انتخاب اسناد مرتبط و نادیده گرفتن...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023